Mô hình hồi quy là gì? Các công bố khoa học về Mô hình hồi quy

Mô hình hồi quy là một phương pháp trong thống kê và máy học để dự đoán giá trị của một biến phụ thuộc dựa trên nhiều biến độc lập. Mô hình hồi quy giả định một...

Mô hình hồi quy là một phương pháp trong thống kê và máy học để dự đoán giá trị của một biến phụ thuộc dựa trên nhiều biến độc lập. Mô hình hồi quy giả định một mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập và cố gắng tìm ra một hàm số tối ưu để ánh xạ các biến độc lập vào biến phụ thuộc.

Mô hình hồi quy có thể được áp dụng cho các loại dữ liệu liên tục hoặc rời rạc và có thể được sử dụng để dự đoán giá trị trong tương lai hoặc giải thích mối quan hệ giữa các biến. Các phương pháp hồi quy phổ biến bao gồm hồi quy tuyến tính, hồi quy logistic, hồi quy đa thức và hồi quy thần kinh mạng.
Mô hình hồi quy đặt mục tiêu là tìm ra mối quan hệ tuyến tính giữa biến phụ thuộc (y) và các biến độc lập (x₁, x₂, ..., xn). Phương pháp này dựa trên giả định rằng mối quan hệ này có thể được biểu diễn bằng một phương trình tuyến tính của các biến độc lập.

Phương trình hồi quy đơn giản nhất là hồi quy tuyến tính. Dạng chung của phương trình hồi quy tuyến tính là:

y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxn

Trong đó:
- y là biến phụ thuộc cần dự đoán.
- x₁, x₂, ..., xn là các biến độc lập được sử dụng để dự đoán y.
- β₀, β₁, β₂, ..., βₙ là các hệ số hồi quy, thể hiện mức độ ảnh hưởng của từng biến độc lập đến biến phụ thuộc.

Mục tiêu của mô hình hồi quy là tìm ra các hệ số hồi quy (β₀, β₁, β₂, ..., βₙ) sao cho phương trình tối ưu hóa khả năng dự đoán của mô hình. Quá trình này thường được thực hiện bằng cách sử dụng các phương pháp như tối thiểu hóa sai số bình phương nhỏ nhất (Least Squares), lập trình tuyến tính, gradient descent và nhiều phương pháp khác.

Có nhiều biến thể khác nhau của mô hình hồi quy như hồi quy đa thức (khi thêm các biến lên mũ khác nhau), hồi quy logistic (cho biến phụ thuộc có giá trị rời rạc), hồi quy ridge (giảm thiểu overfitting) và hồi quy Lasso (điều chỉnh tỷ lệ ảnh hưởng của các biến độc lập).
Mô hình hồi quy tuyến tính là một phương pháp dự đoán giá trị của biến phụ thuộc dựa trên một hoặc nhiều biến độc lập. Mô hình này dựa trên giả định rằng có một mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập.

Phương trình hồi quy tuyến tính có dạng:

y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxn

Trong đó:
- y là biến phụ thuộc cần được dự đoán.
- x₁, x₂, ..., xn là các biến độc lập.
- β₀, β₁, β₂, ..., βₙ là các hệ số hồi quy, biểu diễn mức độ ảnh hưởng của từng biến độc lập đến biến phụ thuộc.

Mục tiêu của mô hình hồi quy tuyến tính là tìm ra các giá trị của β₀, β₁, β₂, ..., βₙ sao cho mô hình hồi quy có khả năng dự đoán tốt nhất. Để làm được điều đó, ta cần sử dụng các phương pháp ước lượng hệ số, như phương pháp tối thiểu hóa sai số bình phương nhỏ nhất (Least Squares Method), phương pháp các đặc trưng tiêu biểu (Stepwise Feature Selection Method) hoặc các phương pháp tối ưu hóa khác.

Ngoài phương trình hồi quy tuyến tính đơn giản, còn có thể sử dụng các biến độc lập với dạng đa thức, tức là biến được tăng lên mũ. Ví dụ, ta có thể thêm các biến x₁², x₁³, ... vào phương trình để khám phá mối quan hệ phi tuyến. Điều này giúp mô hình hồi quy tuyến tính linh hoạt hơn và có thể xấp xỉ tốt hơn với môi trường dữ liệu thực tế.

Mô hình hồi quy tuyến tính cũng có thể được sử dụng cho dữ liệu không chỉ có biến phụ thuộc liên tục mà còn có biến phụ thuộc rời rạc. Khi biến phụ thuộc là các giá trị rời rạc, ta có thể sử dụng mô hình hồi quy logistic để dự đoán xác suất xảy ra của một sự kiện, với giá trị dự đoán nằm trong khoảng từ 0 đến 1.

Danh sách công bố khoa học về chủ đề "mô hình hồi quy":

Tính chất của các bài kiểm tra phụ thuộc không gian trong mô hình hồi quy tuyến tính Dịch bởi AI
Geographical Analysis - Tập 23 Số 2 - Trang 112-131 - 1991

Dựa trên một số lượng lớn các thí nghiệm mô phỏng Monte Carlo trên một mạng lưới đều đặn, chúng tôi so sánh các tính chất của kiểm tra Moran's I và kiểm tra nhân tử Lagrange đối với phụ thuộc không gian, tức là đối với cả tự tương quan lỗi không gian và biến phụ thuộc được suy rộng không gian. Chúng tôi xem xét cả độ chệch và sức mạnh của các bài kiểm tra cho sáu cỡ mẫu, từ hai mươi lăm đến 225 quan sát, cho các cấu trúc khác nhau của ma trận trọng số không gian, cho nhiều phân bố lỗi bên dưới, cho các ma trận trọng số được chỉ định sai, và cho tình huống khi có hiệu ứng ranh giới. Kết quả cung cấp chỉ số về các cỡ mẫu mà các tính chất tiệm cận của các bài kiểm tra có thể được xem là có hiệu lực. Chúng cũng minh họa sức mạnh của các bài kiểm tra nhân tử Lagrange để phân biệt giữa phụ thuộc không gian thực chất (trễ không gian) và phụ thuộc không gian như một phiền nhiễu (tự tương quan lỗi).

#Moran's I #nhân tử Lagrange #phụ thuộc không gian #tự tương quan lỗi #trễ không gian #ma trận trọng số không gian #mô phỏng Monte Carlo #mô hình hồi quy tuyến tính #hiệu ứng ranh giới
Nồng độ chlorophyll, vật chất lơ lửng và gelbstoff trong các vùng nước loại II được suy diễn từ dữ liệu máy quét màu vùng ven biển vệ tinh bằng phương pháp mô hình hồi quy ngược Dịch bởi AI
American Geophysical Union (AGU) - Tập 99 Số C4 - Trang 7457-7466 - 1994

Các kỹ thuật tỷ lệ màu được sử dụng để suy diễn nồng độ chlorophyll từ dữ liệu bức xạ của máy quét màu vùng nước ven biển (CZCS) không hiệu quả ở những vùng có nồng độ vật chất lơ lửng và gelbstoff cao (thường được định nghĩa quang học là nước loại II). Để xem xét tất cả các thành phần nước làm biến đổi trường bức xạ phản xạ cũng như độ bức xạ của đường đi khí dung, một kỹ thuật mô hình hồi quy ngược dựa trên xấp xỉ truyền bức xạ hai dòng và quy trình tối ưu hóa simplex đã được phát triển. Kỹ thuật này sử dụng đồng thời độ bức xạ của bốn kênh phổ CZCS đầu tiên và tối thiểu hóa sự khác biệt χ2 giữa độ bức xạ mô hình và độ bức xạ "đã được hiệu chỉnh Rayleigh" từ CZCS. Mô hình hai dòng được hiệu chỉnh với một tập hợp dữ liệu bức xạ đã được mô phỏng bằng mô hình truyền bức xạ toán tử ma trận. Trong một thử nghiệm đầu tiên, quy trình mô hình hồi quy ngược đã được sử dụng để tạo ra bản đồ phân bố định lượng của chlorophyll fitoplankton, vật chất lơ lửng (trọng lượng khô), và gelbstoff; độ bức xạ đường đi khí dung; và chiều sâu tín hiệu của Biển Bắc. Bằng cách đưa vào độ bức xạ đường đi khí dung như một biến, quy trình này ngụ ý việc hiệu chỉnh khí quyển. Một bản đồ các giá trị còn lại χ2 cho thấy sự thành công của việc phục hồi cho từng pixel.

Một khung làm việc chính quy để mô hình hóa và xác thực các sơ đồ Simulink Dịch bởi AI
Formal Aspects of Computing - Tập 21 Số 5 - Trang 451-483 - 2009
Tóm tắt

Simulink được sử dụng rộng rãi trong ngành công nghiệp để mô hình hóa và mô phỏng các hệ thống nhúng. Với việc sử dụng ngày càng tăng của các hệ thống nhúng trong các tình huống an toàn thời gian thực quan trọng, Simulink trở nên thiếu khả năng phân tích yêu cầu (thời gian) với độ tin cậy cao. Trong bài viết này, chúng tôi áp dụng Tính toán Khoảng thời gian Thời gian (TIC) - một ngôn ngữ đặc tả thời gian thực, để bổ sung khả năng kiểm định chính quy TIC cho Simulink. Chúng tôi xây dựng một cách tỉ mỉ các hàm thư viện TIC để mô hình hóa các khối thư viện Simulink, được sử dụng để tạo thành các sơ đồ Simulink. Tiếp theo, các sơ đồ Simulink được tự động chuyển đổi thành các mô hình TIC, bảo toàn các khía cạnh chức năng và thời gian. Các yêu cầu quan trọng như liveness bị giới hạn thời gian có thể được đặc tả chính xác trong TIC cho toàn bộ sơ đồ hoặc một số thành phần. Cuối cùng, việc xác thực các mô hình TIC có thể được tiến hành chặt chẽ với một mức độ tự động hóa cao bằng cách sử dụng một công cụ định lý chung. Khuôn khổ của chúng tôi có thể mở rộng không gian thiết kế bằng cách đại diện cho các thuộc tính môi trường cho các hệ thống mở và xử lý các sơ đồ phức tạp vì việc phân tích hành vi liên tục và rời rạc được hỗ trợ.

#Tính toán Khoảng thời gian Thời gian #Simulink #hệ thống nhúng #xác thực chính quy #mô hình hóa #ngôn ngữ đặc tả thời gian thực
Các hành vi đánh đổi giữa hoạt động ảo và hoạt động thể chất trong giai đoạn đầu của đại dịch COVID-19 Dịch bởi AI
European Transport Research Review - Tập 13 Số 1 - 2021
Tóm tắt Giới thiệu

Làn sóng đầu tiên của đại dịch COVID-19 đã thay đổi một cách đáng kể cuộc sống của mọi người trên toàn thế giới. Để đối phó với sự gián đoạn này, các giải pháp kỹ thuật số đã trở nên phổ biến hơn. Tuy nhiên, khả năng áp dụng các giải pháp kỹ thuật số khác nhau giữa các nhóm xã hội - kinh tế và xã hội - nhân khẩu học.

Mục tiêu

Nghiên cứu này điều tra cách mà các cá nhân đã thay đổi mô hình di chuyển và sử dụng internet trong giai đoạn đầu của đại dịch COVID-19, và những thay đổi nào trong số đó có thể được duy trì.

Phương pháp

Một cuộc thu thập dữ liệu thực nghiệm đã được triển khai thông qua các biểu mẫu trực tuyến. 781 phản hồi từ các quốc gia khác nhau (Ý, Thụy Điển, Ấn Độ và các quốc gia khác) đã được thu thập, và một loạt các phân tích đa biến đã được tiến hành. Hai mô hình hồi quy tuyến tính được trình bày, liên quan đến sự thay đổi hoạt động di chuyển và sử dụng internet, trước và trong giai đoạn đại dịch. Hơn nữa, một mô hình hồi quy nhị phân được sử dụng để xem xét khả năng của các người trả lời trong việc áp dụng và duy trì hành vi của họ vượt ra ngoài giai đoạn đại dịch.

#COVID-19 #hành vi trực tuyến #mô hình hồi quy #thay đổi hành vi #chuyển đổi số
Nghiên cứu thực nghiệm về truyền tải chính sách tiền tệ qua kênh tín dụng tại Việt Nam
Bài viết đánh giá thực trạng truyền tải chính sách tiền tệ (CSTT) qua kênh tín dụng tại Việt Nam trong giai đoạn 1998-2012 qua mô hình kinh tế lượng. Bằng việc xây dựng mô hình vector tự hồi quy cấu trúc (SVAR), nhóm tác giả đã mô hình hóa các mối quan hệ giữa các chỉ tiêu tiền tệ như lãi suất, tín dụng và các biến số kinh tế vĩ mô như tăng trưởng, lạm phát trong nền kinh tế Việt Nam. Qua đó, nhóm tác giả phân tích định hướng và mức độ truyền tải CSTT của Ngân hàng Nhà nước qua kênh tín dụng tới các chỉ tiêu tiền tệ và các biến số kinh tế vĩ mô.  
#kênh tín dụng #mô hình vector tự hồi quy cấu trúc #truyền tải chính sách tiền tệ.
Các yếu tố ảnh hưởng đến giá trị bất động sản công nghiệp ở khu vực phía Nam Việt Nam bằng phương pháp hồi quy
TẠP CHÍ VẬT LIỆU & XÂY DỰNG - Tập 11 Số 05 - Trang Trang 99 - Trang 103 - 2021
Gần đây, Bất động sản công nghiệp ở Việt Nam phát triển rất mạnh mẽ. Tuy nhiên, việc phát triển quá mạnh mẽ như vậy dẫn đến tiềm ẩn nhiều rủi ro. Do đó việc xác định các yếu tố ảnh hưởng đến giá trị bất động sản công nghiệp cụ thể là khu vực phía Nam Việt Nam là cần thiết và mang ý nghĩa thực tiễn rất lớn. Nghiên cứu này được tiến hành qua 2 giai đoạn. Giai đoạn 1, hai mươi lăm yếu tố được yêu cầu đánh giá mức độ ảnh hưởng đến giá trị bất động sản công nghiệp dựa trên các số liệu thu thập được từ 104 người các nhà đầu tư,đơn vị người có kinh nghiệp trong lĩnh vực bất động sản công nghiệp thông qua 5 nhóm yếu tố chính là: chất lượng, chi phí, vị thế, khách quan và yếu tố khác. Tiến hành kiểm định trị trung bình để đánh giá các yếu tố nào ảnh hưởng sau đó kiểm định thang đo được tiến hành để đánh giá sự phù hợp của thang đo. Phân tích nhân tố là bước cuối cùng ở giai đoạn 1 để rút gọn các yếu tố và xác định được chín nhân tố chính ảnh hưởng cũng như các yếu tố ẩn sau các nhân tố chính đó. Giai đoạn. Ở giai đoạn 2, từ chín nhân đã được xác nhận ở giai đoạn 1, tiến hành thu thập dữ liệu của 64 nhà xưởng ở Tp Hồ Chí Minh và các khu vực lân cận phía Nam. Sau khi loại các giả thuyết ban đầu không có ý nghĩa thống kê ra khỏi mô hình. Mô hình hồi quy cuối cùng với các trọng sổ của các giả quyết đều có ý nghĩa thống kê được thiết lập. Kết quả phân tích các nhân tố ở giai đoạn 1 đã bộc lộ được nhiều khía cạnh tiềm ẩn bên trong thực sự ảnh hưởng đến giá trị bất động sản công nghiệp ở khu vực phía Nam. Nghiên cứu cũng đã xây dựng được một hình ước lượng giá trị bất động sản công nghiệp ở phía Nam.
#Bất động sản công nghiệp #Yếu tố ảnh hưởng #Mô hình hồi quy OLS
Mô hình hồi quy Bootstrap với cỡ mẫu ngẫu nhiên
Nhiều phương pháp thống kê cổ điển khi tìm khoảng tin cậy cho các hệ số hồi quy cần giả thiết về phân bố tiên nghiệm của các sai số. Với một số giả thuyết nhất định, không cần giả thiết về phân phối của sai số, thủ tục bootstrap có cỡ mẫu lấy lại cố định hoặc ngẫu nhiên có thể thực hiện xấp xỉ bootstrap của phân phối ước lượng bình phương tối thiểu các hệ số hồi quy. Trong bài báo này, tác giả trình bày thuật toán xác định hệ số hồi quy của mô hình hồi quy bootstrap với cỡ mẫu lấy lại là biến ngẫu nhiên Nn.Nn nhận giá trị là các số nguyên dương trên [m, n] với khả năng là như nhau tại mọi giá trị, trong đó m là số nguyên dương nhỏ nhất lớn hơn hoặc bằng n/4. Sử dụng phần mềm Matlab xác định hệ số hồi quy bootstrap thực nghiệm và đưa ra nhận xét.
#bootstrap #regression #resampling #random resample size #uniform distribution
Ý ĐỊNH MUA VÀ SẴN SÀNG TRẢ GIÁ CAO CỦA NGƯỜI TIÊU DÙNG ĐỐI VỚI THỰC PHẨM HỮU CƠ: ỨNG DỤNG MÔ HÌNH HỒI QUY LOGISTICS
Tình hình tiêu thụ thực phẩm hữu cơ đã tăng trong thời gian gần đây và đáp ứng được mối quan tâm của người tiêu dùng về các vấn đề liên quan đến sức khỏe, hạnh phúc và môi trường. Tuy nhiên, việc gia tăng tiêu thụ vẫn còn nhiều hạn chế so với tiềm năng của thị trường. Nghiên cứu này nhằm mục đích điều tra các yếu tố ảnh hưởng đến ý định mua và sẵn sàng trả giá cao của người tiêu dùng đối với thực phẩm hữu cơ. Với một mẫu nghiên cứu gồm 267 người tiêu dùng được khảo sát trực tiếp tại các hộ gia đình ở thành phố Hồ Chí Minh, các giả thuyết đã được kiểm định bằng mô hình hồi quy logistics. Kết quả xác nhận rằng, đặc điểm gia đình, thái độ, nhận thức an toàn và rào cản rủi ro là những yếu tố chính ảnh hưởng đáng kể đến ý định mua và sẵn sàng trả giá cao của người tiêu dùng đối với thực phẩm hữu cơ. Kết quả của nghiên cứu này cung cấp những hiểu biết sâu sắc cho nhà quản lý và tiếp thị về các biến số chính thúc đẩy tiêu thụ thực phẩm hữu cơ trong nước.
#Organic food #purchase intention #willingness to pay a premium #logistic regression
Các yếu tố ảnh hưởng tới khả năng di cư việc làm của hộ gia đình tại Việt Nam
Tạp chí Khoa học Đại học cần Thơ - Tập 56 Số 4 - Trang 238-247 - 2020
Di cư là một yếu tố của quá trình phát triển đặc biệt là tại các nước đang phát triển. Các nghiên cứu đã chỉ ra rằng, lý do chủ yếu dẫn đến hiện tượng di cư là vì kinh tế và loại hình di cư chủ yếu là di cư việc làm. Tại Việt Nam, với quá trình phát triển kinh tế nhanh chóng từ khi đất nước Đổi mới, làn sóng di cư đã tăng lên mạnh mẽ và có nhiều đóng góp cho sự phát triển nhưng đồng thời cũng tạo ra nhiều thách thức cho sự phát triển của xã hội. Bài viết này sử dụng phương pháp hồi quy Logit để ước tính xác suất di cư của hộ thông qua việc sử dụng số liệu mảng (panel data) của bộ dữ liệu Khảo sát mức sống (VHLSS). Mô hình nghiên cứu đề xuất với các biến thuộc về đặc trưng nhân khẩu của chủ hộ và đặc điểm của hộ cũng như tình trạng kinh tế của hộ. Kết quả  cho thấy những yếu tố thuộc về đặc trưng nhân khẩu của chủ hộ và của hộ tác động mạnh mẽ tới xu hướng di cư của hộ đặc biệt là yếu tố tiền gửi.
#Di cư việc làm #Mô hình hồi quy logit #Khảo sát mức sống
Tổng số: 86   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 9